SPSS 数据准备 1 – 概述主要步骤
作者:Ruben Geert van den Berg,发布于 数据准备 专栏
当我们开始分析数据文件时,首先要检查数据是否存在一些常见问题。例如,我们要确保变量具有正确的格式,不包含任何奇怪的值,并具有合理的分布。下表建议了应该采取的步骤以及顺序。
为了充分利用这些教程,我们鼓励您下载并打开 hotel_evaluation.sav 文件,跟着教程一起操作。
SPSS 数据准备 - 概述主要步骤
序号 | 检查内容 | 如何检查? | 如何修复? |
---|---|---|---|
1 | 案例数和变量数 | 检查 数据视图 (Data View) | (不适用) |
2 | 唯一案例标识符 (Unique Case Identifier) | 使用 AGGREGATE 命令 | 创建唯一 ID 变量 |
3 | 不良变量类型 (Undesirable Variable Types) | 检查 变量视图 (Variable View) 和 数据视图 (Data View) | 转换变量 |
4 | 用户缺失值 (User Missing Values) 的存在 | 每个变量的频数表或直方图 | 指定 用户缺失值 (User Missing Values) |
5 | 具有大量缺失值的变量 (Variables with many missing values) | 每个变量的条形图或直方图 | 删除变量或从分析中排除 |
6 | 不方便的分布 (Inconvenient distributions) | 每个变量的条形图或直方图 | 删除变量或从分析中排除 |
7 | 小类别 (Small categories) | 每个变量的条形图 | 合并类别 |
8 | 不良编码 (Undesirable coding) | 每个变量的条形图 | 反向编码变量 |
9 | 具有大量缺失值的案例 (Cases having many missings) | 计算每个案例的缺失值数量 | 从分析中排除案例 |
SPSS 数据准备 - 工作流程
那么,我们如何在实践中执行这些检查呢?我们建议您首先执行步骤 1-3,因为它们涉及整个数据文件。
接下来,我们单独检查数据中的每个变量 - 从上到下。如果变量是分类变量,我们创建一个带有条形图的频数表。如果变量是计量变量,我们运行一个直方图。基于此输出,我们执行步骤 4-8。
这些步骤的所有输出都是使用简单的 FREQUENCIES 命令创建的,该命令可以一次处理多个变量。您可以考虑为(类似编码的)变量组运行这些命令,而不是单独处理变量。
在检查 - 并可能纠正 - 每个变量之后,我们完成步骤 9。